《天安门母亲网站》- 六四论坛

《從博弈論的視角看1989》
ĦŞ紀念Ħ°六四Ħħ36周年的一點思考



 


 


萬潤南


 


 


 

我們試着從博弈論的視角來探討這個問題。因為博弈論是一門研究理性行為者在相互影響中如何做決策的科學,而1989年正是一個由多個行為體ĦŞĦŞ體制內部、學生群體、知識分子、國際輿論ĦŞĦŞ共同構成的高度複雜的博弈過程。理解這些角色之間的策略互動,或許可以幫助我們更冷靜地總結經驗與教訓。

 

一、體制內部的非對稱博弈:強權下的兩種Ħ°自我對弈Ħħ

 

1989年的權力結構表面上似乎存在三股力量:李鵬所代表的保守派、趙紫陽所代表的改革派,以及居於Ħ°最高決策者Ħħ地位的鄧小平。但若從實質權力結構來看,體制內部實際上只有一位真正的博弈主導者ĦŞĦŞ鄧小平。其他人,不過是他不同意志傾向的體現。

 

李鵬的強硬主張與趙紫陽的寬容勸諭,並非兩股平行的力量博弈,而更像是鄧小平內在兩種判斷之間的矛盾投射。毛澤東對鄧的評價Ħ°綿里藏針Ħħ可謂一語中的:一方面,他支持改革、講效率;另一方面,他深信Ħ°穩定壓倒一切Ħħ,始終保留以武力壓制混亂的底色。在毛澤東的另一句評語中,鄧小平是Ħ°開鋼鐵公司的ĦħĦŞĦŞ意指其意志之剛,手段之硬。

 

博弈論中,若一位參與者同時控制多個Ħ°玩家Ħħ,這構成不對稱博弈中的Ħ°操縱式結構Ħħ(manipulated structure),其結果是看似多元分歧的判斷,最終被統一為一個中心權力的輸出。這也解釋了為何趙紫陽儘管身為總書記,卻毫無實權;為何李鵬可以在關鍵會議中持續發難ĦŞĦŞ因為在那套權力配置下,他們的影響力並不取決於自身身份,而取決於他們所代表的那一面是否正被鄧小平所採納。

 

趙紫陽真正的失敗,不是因為觀點站不住腳,而是因為他在結構上無法影響鄧的決斷路徑。他一度試圖以情動人、以理服人,但鄧小平早已將事態視為Ħ°動亂Ħħ,並將穩定定義為壓倒一切的Ħ°零容忍紅線Ħħ。趙的理性、對話策略,自此便失去了博弈的現實基礎。結果是,一位體制內的溫和改革者,被孤立、邊緣化,直至徹底出局。

 

這類結構性不對稱,恰如托馬斯Ħ¤謝林(Thomas Schelling)在《衝突的策略》中所描述的Ħ°偽多方博弈Ħħ:Ħ°當一個意志中心控制多數角色時,其它玩家不過是擴音器。Ħħ政治表象下的多元辯論,不過是單一決策者自我反覆權衡的痕跡。

 

二、絕食行動與道義壓力:民間博弈策略的誤區

 

學生運動在5月中旬進入高潮,最具象徵意義的轉折點是絕食行動。博弈論稱這種行為為Ħ°代價性承諾Ħħ(costly commitment):以自我傷害來表達行動意志,提升自身話語的可信度。這種策略常用於Ħ°信號博弈Ħħ中,比如古代的焚船明志、現代的工人罷工、社會運動中的絕食。

 

絕食確實起到了激發全國輿論、爭取民眾同情的作用,也在一定程度上促使高層改革派發聲。但是,它也把協商推入了更狹窄的空間。因為:絕食意味着Ħ°不達目的不撤離Ħħ,學生逐漸陷入Ħ°騎虎難下Ħħ的境地;趙紫陽的中間調停空間被壓縮,他既不能讓學生撤退,也無法向高層保證事態可控;高層保守派則據此認定Ħ°這是動亂升級的信號Ħħ,為戒嚴和後續鎮壓尋找借口。

 

道義升級反而加速了博弈的激烈化。學生以犧牲為代價發出信號,卻因制度缺乏Ħ°接收信號Ħħ的機制,最終變成了Ħ°誤讀Ħħ與Ħ°誤判Ħħ。一個以道德為主導的策略,若缺乏制度性緩衝,很容易將原本可能妥協的局勢逼上不歸路。

 

在博弈論中,絕食屬於Ħ°代價性信號Ħħ(costly signal)的種。根據邁克爾Ħ¤斯賓塞(Michael Spence)的信號博弈理論,一個理性行動者通過承擔高代價的行為來證明其訴求的真實性。學生絕食,正是試圖通過Ħ°自我犧牲Ħħ向當局和公眾發出Ħ°我並非投機,我是認真的Ħħ這一信號。但問題在於:信號的Ħ°接收者Ħħ也必須理性且有回應機制。若缺乏制度性反饋路徑,則再強烈的信號也可能被誤讀或被忽略,甚至反而促使接收方進入Ħ°防禦狀態Ħħ。正如諾貝爾經濟學獎得主羅傑Ħ¤邁爾森(Roger Myerson)所指出的:

 

Ħ°如果機制設計無法處理非對稱信息,玩家就可能選擇封閉式策略以防最壞局面。Ħħ(Myerson, Ħ°Game Theory:Analysis of ConflictĦħ, 1991)絕食在缺乏反饋機制的語境下,實際上形成了一種戰略不對稱:學生不能後退,因為那將視為妥協甚至失敗;政府若退讓,則意味着道義上的Ħ°投降Ħħ。從此刻起,協商空間迅速壓縮,走向不可逆的對抗。

 

三、517宣言:將權威推入對抗的死角趙紫陽在歡迎戈爾巴喬夫的公開場合首次向外界明確披露Ħ°鄧小平是中國最高決策者Ħħ,這不僅削弱了趙自身的合法性,也把鄧小平逼到前台。緊接着知識分子的517公開信更是直接把矛頭指向他,這構成了雙重逼宮。這在博弈論中相當於觸發了一種Ħ°激化型信號Ħħ:原本可以模糊處理的權力歸屬問題,被公之於眾,使得鄧的退路大大收窄。他不再是可以兩邊調停的Ħ°仲裁者Ħħ,而成了博弈場上的Ħ°公開玩家ĦħĦŞĦŞ而一旦成為明面上的玩家,他就必須贏,哪怕以最極端的方式。

 

可以用謝林的Ħ°承諾困境(commitment trap)Ħħ理論來解釋這一點:一旦一個參與者在公開場合做出不可逆的身份確認,他就無法再進行靈活周旋,任何退讓都被視為失敗。(鄧當時就詰問:退?退到哪一步?)這就是趙紫陽發言造成的後果ĦŞĦŞ他意圖爭取民意支持,卻客觀上切斷了體制內最後一點轉圜空間。我當時用Ħ°揮刀自宮Ħħ來形容趙的這一舉動。我認為這是他在博弈結構中的致命誤判。517日,部分知識分子聯名發布公開信,要求Ħ°鄧小平下台,結束垂簾聽政Ħħ,推動政治體制改革。在博弈論的術語中,這種公開挑戰相當於將非零和博弈強行轉化為零和對抗。

 

原本高層尚可保持模糊與靈活身份,但公開點名意味着權威被直接挑戰,使得Ħ°讓步Ħħ從策略選擇變成Ħ°失控Ħħ象徵。此舉帶來的後果,是鄧小平徹底放棄中間協調角色,轉向強硬立場。而趙紫陽在黨內正式被邊緣化,63日晚上至64日凌晨,武力鎮壓在北京展開。這是一次信息極化後的結構性崩潰。在沒有憲政與程序緩衝的結構中,任何試圖直接衝撞權力頂端的信號,都容易引發失控反應。歷史上許多相似例子都說明:不給對手留體面退路,是最容易引發徹底對抗的策略失誤。

 

從社會運動角度看是Ħ°訴諸正義Ħħ;但從博弈論看,這是一次典型的Ħ°極限策略Ħħ(brinkmanship)。高層集體面臨Ħ°若不強硬即崩盤Ħħ的共同體幻覺(collective action illusion);於是,公開挑戰反而將原本尚有退路的對手逼入死角。謝林也警告過:Ħ°在無緩衝機制的社會中,過度清晰的威脅往往導致無法控場的災難。Ħħ(Schelling, 1960

 

四、博弈失敗的結構教訓

 

今天回望,不是為了對當事人簡單指責,而是為了理解:1989年的失敗,不是因為一方理性、一方愚蠢,而是因為各方在沒有制度保障的環境中,都被結構推向了非理性。體制內缺乏合法博弈機制;民間缺乏組織與協調能力;雙方都缺乏Ħ°台階Ħħ的設計意識;信任基礎幾乎不存在;最終,演變成一次典型的Ħ°囚徒困境Ħħ:本可雙贏,最終卻是兩敗俱傷。

 

1989年可以被視作一次Ħ°重複博弈失敗Ħħ的案例。在羅伯特Ħ¤阿克塞爾羅德(Robert Axelrod)提出的Ħ°囚徒困境長期博弈Ħħ理論中,理性玩家往往通過Ħ°寬容但堅定Ħħ(tit for tat)策略達成長期合作。然而,該策略的前提是:各方能觀察對方的行為;有回合之間的長期互動;存在懲罰失信者的制度。現實中,政府與民間運動之間缺乏有效的信息共享機制,彼此也未建立起任何形式的Ħ°長期信用Ħħ。於是,Ħ°互信型博弈Ħħ很快淪為Ħ°單次極化博弈Ħħ,演變為最壞的納什均衡:武力鎮壓 + 輿論破裂,是所有參與者都不希望發生卻不得不接受的最差結果之一。

 

正如阿克塞爾羅德所言:Ħ°若缺乏合作文化與容錯機制,最優策略最終將失敗於結構的剛性。Ħħ(Axelrod, Ħ°TheEvolution of CooperationĦħ, 1984

 

五、未來博弈中妥協的智慧:如何避免再次走入死角?

 

如果說紀念是為了未來,我們就必須認真思考:在未來的社會博弈中,如何更理性地行動,避免再度走入1989年那樣的死角?我認為,有四條基本原則值得我們記住:永遠不要把對手逼到死角。要適時妥協,給對手留餘地,就是給自己留餘地。體面退場的機制,是任何可持續博弈的基本保障。建立可信的Ħ°中介機制Ħħ。在制度完善之前,需要半官方、非對抗性的溝通渠道和民間平台,避免局勢迅速升級為零和對抗。保持模糊空間。信息極化往往促成激進行動,而激進行動則加劇誤判。社會轉型期的對話,需要足夠的Ħ°含混Ħħ與Ħ°緩衝Ħħ。

 

着眼長遠,避免一局定勝負。社會的改革不是短跑,而是馬拉松。避免Ħ°贏一次就算贏到底Ħħ的錯覺,保持合作關係遠比階段性勝利更重要。從1989年天安門事件的博弈論分析中,我們得到的最深刻教訓之一是:政治博弈不是決一死戰,而是尋找共贏與可持續路徑的藝術。

 

任何一方如果只盯着Ħ°勝負Ħħ,而忽視對手的承受極限與退讓空間,最終往往會把局勢推向Ħ°零和博弈Ħħ,錯失和平解決的窗口。尤其在面對體制性強權時,理想主義若沒有策略、情緒表達若不顧結構邏輯,最終會讓所有人付出代價。博弈論告訴我們:最優解往往不是最大化自身利益,而是最大化Ħ°共同生存的可能Ħħ。

 

這正是Ħ°妥協Ħħ之所以重要ĦŞĦŞ它不是軟弱,而是智慧;不是放棄原則,而是避免局勢滑入不可逆的災難。1989年缺失的,正是這種妥協的智慧。

 

結語:紀念,不只是為了記住,更是為了走得更遠我們紀念Ħ°六四Ħħ,不是為了怨恨,而是為了更清晰地認識世界運行的邏輯,更有智慧地面對未來的博弈。如果我們能從歷史中學會不把彼此逼入死角,如果我們能在衝突中學會克制、設台階、建機制,那三十六年前那些人的犧牲,就不僅是痛苦的終點,也會成為更理性社會的起點。願這份紀念,不只是回望,更是一種前行。





原載《rfi